SSML,全稱為Speech Synthesis Markup Language(語音合成標記語言)
主要是用來控制文本轉語音(TTS)系統達到合成語音的目的
允許開發者指定文本該如何被轉換成語音,其中呢,包括語調、速度、音量、停頓等細節可以進行調整
透過SSML可以使語音輸出變得更加自然,也更能符合特定需求
在用以控制語音合成方面上有許多常見標籤,列舉用途如下:
<speak>
:SSML的根標籤,所有的SSML內容都應該被包含在這個標籤內<break>
:可用來指定停頓的時間<prosody>
:可用於調整語音的音調、速度和音量<say-as>
:用於定義如數字、日期、時間等的格式<emphasis>
:可用來強調某些詞語或句子,並據此設定不同強度<audio>
:插入聲音檔<sub>
:可用於替換<phoneme>
:可用於指定發音